Apprentissage de la lecture au cycle 2

PRINCIPE ALPHABÉTIQUE ET LECTURE

1. Introduction
2. Les performances en lecture aux âges qui correspondent À la fin du cycle 2 et du cycle 3
3. À la recherche d’explications
3.1. Contribution des épreuves techniques
3.2. Moment de l’automatisation des procédures d’identification des mots
3.3. Types de pédagogie
4. Des épreuves aux compétences techniques
4.1. Les composantes principales des épreuves techniques
4.2. Contributions des composantes principales
5. Discussion
5.1. Quelle lecture ?
5.2. Quel lecteur ?
5.3. Quelle recherche ?
5.4. Quels apports ?

"La victoire de la raison ne peut être que la victoire de ceux qui raisonnent. " Bertolt BRECHT

Introduction
Les données analysées ici ont été recueillies au cours d’une recherche menée conjointement par l’AFL et l’unité de l’INRP : Didactique des apprentissages de base. La question sous-jacente À cette recherche concerne l’enseignement du principe alphabétique comme base (et/ou comme recours lors) de l’apprentissage de la lecture. Y a-t-il avantage À prendre appui sur ou À se priver de cette correspondance entre l’écrit et l’oral qui, semble-t-il, en peu de temps, donne À l’apprenti une autonomie suffisante À partir de laquelle il pourra développer ses propres stratégies, bien au-delA de la capacité initiale et initiante À identifier un mot écrit en construisant sa forme sonore et À le produire en notant sa forme orale ?

La nécessité proclamée de faire reposer l’apprentissage de la lecture sur l’exercice du principe alphabétique peut être interrogée par de multiples entrées : déjA par les résultats À terme médiocres d’un enseignement dont il constitue la base mais aussi par la manière dont s’opère (ou non) le passage des stratégies indirectes qui sont ainsi apprises aux stratégies directes qui semblent celles du lecteur expert, quel que soit le système d’écriture. Quelle continuité y a-t-il entre une stratégie initiale qui suppose qu’une forme écrite doit être transformée pour devenir signifiante et la stratégie attendue qui suppose qu’une forme écrite est signifiante pour l’œil de la même manière qu’une forme orale l’est pour l’oreille, et sans subordination de l’une À l’autre ? Est-il, pour autant, imaginable d’apprendre d’abord À rencontrer l’écrit comme un système linguistique et non comme un système de notation ? Est-il bien raisonnable de refuser d’investir dans une autonomie immédiate qui permet rapidement À l’apprenti de tout " lire " ? En d’autres termes, est-il judicieux de renoncer À s’appuyer sur la médiation phonologique et d’investir directement dans les stratégies autonomes qu’emprunte le lecteur expert ? Faut-il même choisir et ces deux constructions ne seraient-elles pas heureusement complémentaires ?

À ces questions, les réponses courantes affirment la nécessité d’un enseignement du principe alphabétique et du code de correspondance grapho-phonologique. Cette position qui rencontre le sentiment d’un grand nombre d’enseignants est, pour l’essentiel, déduite, prescrite et argumentée À partir de recherches de psychologie. Est rarement abordée, À cette occasion, la question de la pertinence du transfert de conclusions d’un champ de recherche À un autre. On voit mal d’ailleurs qu’elle puisse l’être en l’absence, du côté de la recherche pédagogique, d’une méthodologie alternative et de la mise en œuvre de plans expérimentaux prenant appui sur le suivi de cohortes d’enfants enseignés selon différentes procédures. C’est À un tel travail que l’unité Didactique des apprentissages de base s’est consacrée depuis 1990 en ayant accompagné une cohorte de 76 enfants dès la fin de la grande section jusqu’au CE2, répartis selon 3 options pédagogiques, une première qui prétend enseigner directement la voie directe et exclut le recours À la correspondance grapho-phonologique pour entrer dans l’écrit, une seconde qui fait explicitement de cette correspondance le principe sur lequel doit se construire le processus de lecture, une troisième qui fait de ce principe un recours et/ou une vérification ni préalables ni séparables du traitement sémantique. L’observation de la pédagogie ainsi que le recueil des données longitudinales auprès des élèves ont fait appel À un important dispositif(1). L’unité INRP a publié en 1994-95 un rapport de recherche sur cette première étape. En juin 1995 (donc théoriquement en fin de CM2(2)), 59 élèves sur les 76 initiaux ont pu être À nouveau évalués de manière approfondie(3). Nous allons présenter ici quelques résultats, plutôt inhabituels(4), qui n’auront le pouvoir de questionner les opinions que de ceux qui s’obligent À les construire sur des faits.


Les performances en lecture aux âges qui correspondent À la fin du cycle 2 et du cycle 3
Ces performances en lecture sont décrites par un score composite établi À partir de plusieurs épreuves mesurant, de manières aussi voisines que possible, d’un cycle À l’autre, la qualité de la compréhension d’écrits diversifiés et complexes(5).


Les résultats(6) en fin de CE1 suggèrent qu’un enseignement qui ne mise pas sur la transformation de l’écrit en oral tend À conférer moins d’efficacité en lecture dans les débuts de l’apprentissage comparé aux enseignements qui prennent appui sur le principe alphabétique, bien qu’on ne constate ici aucune différence significative. Le principe alphabétique produirait un léger gain d’autonomie initiale face À des écrits sans doute peu éloignés, dans leur fonctionnement, de ce qui se conçoit À l’oral. Mais cette différence s’inverse dans les années qui suivent, comme si l’investissement relativement coûteux que constitue le choix de rencontrer l’écrit en tant que système linguistique autonome (et non comme système de notation renvoyant plus ou moins À l’oral) libérait ensuite une meilleure efficacité, cette fois significative, face À des textes dont le fonctionnement est de plus en plus spécifique de l’écrit.

L’analyse de ces progressions différentes permet d’avancer une hypothèse : l’absence d’enseignement du principe alphabétique rend difficile l’exercice du décodage, mais cette absence de recours À la voie indirecte rendrait plus aisée (plus nécessaire ?) l’appropriation d’un autre mode de traitement de l’écrit, mieux adapté À sa spécificité donc plus efficace À terme(7). On doit auparavant vérifier que ces résultats au CM2 n’ont pas pour origine l’intervention ultérieure : ne serait-ce pas la pédagogie du cycle 3 qui, pour les uns, compenserait les déficits, pour les autres, effriterait les bénéfices et, en dernière analyse, rendrait compte de l’inversion significative ?


À la recherche d’explications
Nous allons utiliser la régression multiple pour tenter " d’expliquer " la performance de lecture À l’âge correspondant À la fin du cycle 3. Nous prendrons les variables explicatives(8) vers la fin de l’apprentissage initial, précisément en février de CE1. Ces variables sont les résultats obtenus À 5 épreuves techniques :

*5 épreuves techniques :

- épreuve lexicale donnant un score d’identification de mots isolés (présentés ou non dans un contexte phrastique oral), score majoré par la vitesse d’identification

- épreuve grapho-phonologique mesurant la qualité du déchiffrage de pseudo-mots afin de décrire la connaissance de la valeur sonore, hors contexte lexical, de quelques-uns des phonogrammes de 2 ou 3 lettres parmi les plus fréquents de la langue française

- épreuve graphématique mesurant la qualité de l’écriture inventée, analysée graphème par graphème, épreuve adaptée de Ferreiro.

- épreuve phono-graphique, la même que précédemment mais mesurant la qualité de la transcription phonologique, analysée phonogramme par phonogramme

- épreuve " graphique " consistant À répartir des mots possibles en français (mais inconnus) et des mots impossibles car utilisant des trigrammes n’apparaissant jamais en français dans la position choisie pour le pseudo-mot (construction d’après Content et Radeau, 1988).

Ces 5 scores mesurent la réussite À des épreuves qui, si elles ont été bien construites, sollicitent chacune une compétence précise mais il reste difficile d’assurer qu’elles n’interfèrent pas déjA les unes dans les autres. C’est pourquoi, À ce stade, il semble moins hasardeux de parler encore d’épreuves techniques que de compétences techniques.

À ces variables quantitatives, nous ajoutons deux autres informations :

*un indicateur de l’évolution de l’automatisation des procédures d’identification des mots mesurée au pourcentage de réponses exactes À l’identification de mots isolés ou en contexte (le même principe que l’épreuve lexicale mais sans la pondération par le temps de réponse). Trois modalités :

- automatisation précoce : 90 % de réussite dès le mois de juin de CP

- automatisation moyenne : plus de 70 % À la mi-cours élémentaire

- automatisation tardive : moins de 70 % (et parfois même moins de 40 %) À la mi-cours élémentaire

*et l’indication de la démarche pédagogique

- voie directe : aucun enseignement de la correspondance grapho-phonologique afin de privilégier le développement d’un traitement autonome du système de l’écrit sur des critères internes

- voie indirecte : le processus de lecture entend se construire sur le principe alphabétique et l’exercice de la correspondance grapho-phonologique

- mixte : le recours À la correspondance grapho-phonologique n’est pas un préalable mais se construit au sein du traitement sémantique.

Le principe de la régression multiple (comme de l’analyse de variance et de covariance) consiste À neutraliser les relations entre les variables explicatives du modèle afin de mesurer la relation isolée (on parle de contribution) de chaque variable À la variation de la variable À expliquer (endogène) lorsque les autres variables explicatives (exogènes) sont maintenues constantes. On peut ainsi espérer cerner l’effet propre de chaque variable(9).

Nous prendrons donc simultanément ces 7 variables explicatives pour étudier la performance de lecture en fin de CM2.

Contribution des épreuves techniques


On voit que les résultats de 3 épreuves techniques passées en février de CE1 contribuent positivement et de manière significative À la performance de lecture en fin de cycle 3. Toutes choses restant égales par ailleurs, on sera d’autant meilleur lecteur au CM2 qu’on réussit À la mi-CE1 À identifier vite et bien les mots isolés et en contexte (épreuve lexicale, p = .0005), qu’on réussit À produire une écriture inventée correcte au niveau des graphèmes (épreuve graphématique p = .025), et/ou qu’on réussit À distinguer parmi des formes écrites également prononçables celles qui peuvent se rencontrer en français de celles qui ne peuvent exister (épreuve graphique p = .071).

En revanche, 2 épreuves techniques contribuent de manière négative À la performance finale : la capacité À inventer une écriture correcte au plan des phonogrammes pour des mots inconnus (épreuve phono-graphique
p = .008) et la capacité À proposer une prononciation conventionnelle de pseudo-mots présentés À l’écrit (épreuves grapho-phonologique p = .001). Ces 2 épreuves ont en commun de porter sur des opérations de transcodage, de correspondance entre 2 systèmes, le système phonologique de l’oral et le système graphématique de l’écrit. Toutes choses étant égales par ailleurs, plus on réussit À la mi-CE1 dans des tâches privilégiant dans l’écrit le système de notation de l’oral et plus faibles seront les résultats en lecture À la fin du CM2. Ces faits, incontestables dans leur construction, vont À l’encontre des opinions courantes. Mais ils ne vont pas À l’encontre des résultats d’autres travaux, au moins pour la raison que ce n’est pas ce type d’investigation et d’analyse qui est ordinairement pratiqué !

Il n’est pas facile d’interpréter des contributions négatives lorsqu’elles proviennent de variables construites sur la réussite À des épreuves. Car on ne peut concevoir qu’il soit nuisible d’être " bon ". Tout au plus est-il concevable que cela puisse ne pas servir. Mais dans ce cas, on devrait observer une absence de contribution significative. On en arriverait À ce paradoxe que, pour bien lire au CM2, mieux vaut, au CE1, faire beaucoup d’erreurs en transcrivant phonétiquement des mots entendus et se tromper toujours en déchiffrant des mots écrits inconnus. Force est bien d’approfondir le sens de ces contributions. Un premier effort consiste À sortir de la logique induite par une note qui solde comptablement un savoir ou une ignorance et À chercher de manière plus dialectique en quoi le contraire opprimé d’un savoir est aussi la possibilité d’un autre savoir. En d’autres termes, il faut se donner les moyens de penser les variables explicatives comme autant de facteurs reliant deux pôles, deux modalités de comportements réussis (sans préjuger de leur efficacité) et non simplement une présence À une absence. Un second effort consiste À ne pas perdre de vue que la variable endogène n’est pas la somme des effets juxtaposés des variables exogènes mais, grâce À la régression multiple, quelque chose lié seulement À leur combinaison(10). Ainsi la contribution des variables explicatives ne doit pas être mécaniquement vue comme une somme qui reconstitue le processus de lecture mais comme ce qui a contribué À son développement. Nous verrons plus loin, en tenant compte de ces remarques, qu’il est possible d’entrer plus avant dans la structuration de ces savoirs techniques et, en conséquence, de mieux saisir leur rôle dans l’apprentissage du processus complexe de lecture. Il reste pour l’instant À prendre connaissance de la contribution des deux autres variables exogènes.


Moment de l’automatisation des procédures d’identification des mots



Le moment de l’automatisation des procédures d’identification des mots contribue très significativement À la performance finale de lecture(11), de manière négative pour une automatisation acquise dès la fin du CP, positive lorsqu’elle est reportée au CE1. Ce résultat va, lA encore, À l’encontre de l’opinion courante selon laquelle l’élève doit accéder très tôt au principe alphabétique(12) afin de devenir rapidement autonome devant les mots qu’il rencontre(13). S’il se vérifie que plus tôt on a su identifier des mots et plus faible est, À terme, le résultat en lecture, on ne pourra l’expliquer qu’en recherchant sur quels investissements cette précocité s’est construite, quels processus de traitement de l’écrit elle a privilégiés et donc aussi quels processus elle a dispensé de développer. On trouverait bien d’autres exemples de l’influence des modalités de l’apprentissage initial sur le fonctionnement des usages experts, par exemple dans des conduites physiques complexes(14) ou dans la maîtrise des langues étrangères selon qu’elle s’est développée À travers un enseignement initial du thème et de la version ou par immersion dans une situation de communication unilingue. Si le processus de lecture s’élabore au cours d’un apprentissage qui procède par résolution de problème, force est de faire l’hypothèse qu’un apprenti développe des réponses techniques différentes, voire antagonistes, selon qu’il s’agit de " comprendre " un écrit par recours À un système extérieur (voie indirecte) où À l’intérieur même du système linguistique (voie directe).

On retrouverait ainsi le choix difficile entre une autonomie rapidement acquise par des techniques induisant À terme un processus peu efficace et l’émergence plus lente de techniques complexes plus favorables À l’élaboration d’un processus expert. L’examen des contributions met bien en évidence le rôle négatif de l’automatisation précoce des procédures d’identification des mots. Reste pour autant À comprendre ce qu’un autre usage du temps permettrait de construire de différent.


Types de pédagogie


S’opposent ici nettement(15) l’enseignement construit autour d’un apprentissage linguistique (voie directe) et l’enseignement construit autour de l’apprentissage d’un système de notation (voie indirecte). La démarche pédagogique alliant les deux aspects prend une position intermédiaire non significative, ce qui va À l’encontre du ‘bon sens’ qui, dans le doute, engage À enseigner les deux. Le choix, au cours du cycle 2, de prendre appui sur le principe alphabétique et l’exercice de la correspondance grapho-phonologique entraîne donc, toutes choses égales par ailleurs, une pénalisation de plus de 9 points dans le calcul de la performance théorique tandis que le choix de privilégier le développement du traitement autonome du système de l’écrit sur des critères internes élève le résultat théorique au CM2 de plus de 8 points.

Cette différence théorique de plus de 17 points autour de la moyenne se retrouve presque intégralement, nous l’avons vu, dans les performances réelles (39.5 points contre 55.7). L’analyse statistique confirme donc la différence significative des moyennes entre les 2 types de pédagogie (tableau 1) en y ajoutant le fait que cette contribution fonctionne au sein du modèle général que nous utilisons, donc après qu’on ait retiré toutes les variations introduites simultanément par les résultats aux épreuves techniques et par le degré de précocité des dispositifs d’identification des mots.

Il y a donc incontestablement un effet significatif de la pédagogie du cycle 2 sur la performance de lecture au CM2(16). Pour autant, on n’a pas encore accès, À ce stade de l’analyse, À ce qui rend positif l’effet d’une pédagogie de la voie directe et négative la contribution d’un enseignement prenant appui sur le principe alphabétique.


Des épreuves aux compétences techniques
Nous avons évoqué les difficultés d’interprétation que suscite, comme variables explicatives d’une régression multiple, l’emploi des résultats bruts À des épreuves techniques. Un score À une épreuve traduit un niveau de réussite dans la tâche proposée. Ainsi, l’épreuve où il est demandé d’identifier des mots témoigne-t-elle de la compétence À identifier les mots ; celle où il convient de déchiffrer des pseudo-mots témoigne de la connaissance de la valeur sonore des principaux phonogrammes, etc. Cette relation est probable si l’épreuve est bien construite. Elle ne dit pas si l’habileté À identifier les mots ne crée pas, même pour des mots inconnus, une anticipation de leurs composantes sonores et/ou, inversement, si la connaissance des phonogrammes n’entre pas puissamment dans l’identification des mots. D’où l’efficacité de la régression multiple puisque les inévitables contributions entre variables explicatives sont en quelque sorte neutralisées et que ne s’exprime alors que leur contribution spécifique À la variable À expliquer. Les résultats de la régression multiple donnés dans la partie précédente sont donc rigoureux au sens où ils ne peuvent être autres À partir des mêmes données et en même temps peu " lisibles " dans la mesure où les variables explicatives sont définies par l’épreuve dont elles sont le résultat et non par une compétence technique qu’elle partage probablement avec d’autres épreuves.

L’analyse en composantes principales permet, en conservant strictement identique l’information, de remplacer la juxtaposition de 5 variables probablement liées, et dont on ne sait pas toujours ni si elles mesurent ce qu’on croit ni si elles ne mesurent que cela, par une structure de 5 facteurs indépendants mobilisés par ces épreuves.


Les composantes principales des épreuves techniques
Il s’agit donc, par l’analyse en composantes principales, de répartir la variance des résultats de tous les individus observée aux 5 épreuves techniques entre 5 nouveaux axes dont le principe de construction est l’absence totale d’intercorrélation. La nature de la composante technique que représente chaque nouvel axe se déduit de la contribution des épreuves initiales À sa création(17).


Première composante : comme c’est souvent le cas, le 1er axe est construit sur un effet général de niveau de réussite aux épreuves, en fait À 4 sur 5. Cette 1ère composante exprime un " effet de niveau technique ".


Deuxième composante : le 2ème axe est construit par la seule épreuve graphique. Son niveau de réussite est strictement indépendant du niveau des réussites dans les 4 autres épreuves. Il s’agit, dans cette épreuve, de distinguer les formes écrites qui peuvent se rencontrer en français de celles qui ne peuvent exister. Cette 2ème composante rend compte d’une familiarité visuelle avec ce qui peut exister À l’écrit, d’une expérience scripturale, de quelque chose qui, jusqu'ici, a peu retenu l'attention des chercheurs tant il semble évident que le caractère visuel de l'écriture est masqué par sa fonction de transcripteur phonétique, bref du degré d’existence d’une " conscience graphique ".

Troisième composante : le 3ème axe se construit sur l’opposition d’une épreuve qui invite À prononcer des pseudo-mots présentés À l’écrit et d’une épreuve qui consiste À inventer une écriture satisfaisante au plan des phonogrammes et de leur ordre. La " nature " de ce facteur est À chercher dans ce que ces deux épreuves ont de commun c'est-À-dire l’exercice du principe et du code alphabétiques À travers des correspondances entre oral et écrit. Le " continuum " de ce facteur se situe dans ce qui distingue ces 2 épreuves, ici l’opposition entre une activité de décodage (de l’écrit vers l’oral) et une activité d’encodage (de l’oral vers l’écrit). Cette 3ème composante technique fait ressortir ce qui, dans les épreuves, différencie des " opérations de transcodage ".


Quatrième composante : le 4ème axe se construit sur l’opposition de deux épreuves exploitant la même situation, adaptée de Ferreiro, d’écriture inventée. La nature de ce facteur concerne ce que met en jeu la production d’un mot écrit. Quant À son continuum, il va de la restitution correcte des phonèmes (la reproduction de ce qui s’entend) À l’agencement correct des graphèmes (la production de ce qui se voit). Cette 4ème composante technique réunit ce qui, dans l’ensemble des épreuves, fait appel À " l’écriture " en opposant ce qui contribue À la notation À ce qui relève de l’orthographe.

Cinquième composante : le 5ème axe se construit sur l’opposition entre, d’un côté, 2 épreuves qui font travailler sur des unités élémentaires du code (valeur sonore de quelques-uns des phonogrammes de 2 ou 3 lettres pour la première, qualité de l’écriture inventée mesurée graphème par graphème pour la seconde) et, de l’autre, une épreuve où il s’agit d’identifier vite et bien des mots isolés ou en contexte. Le continuum de ce facteur est plus aisément visible que sa nature : on passe d’une activité qui porte sur des unités linguistiques inférieures au mot oral ou écrit (donc dans tous les cas non signifiantes) À une activité qui porte sur le mot. Il semble prudent de limiter la nature de ce facteur À la taille des unités linguistiques sur lesquelles portent les épreuves(18). Cette 5ème composante techniques concerne donc les " unités linguistiques " de travail.


Contributions des composantes principales
Il est maintenant possible de revenir À la régression multiple que nous avons présentée précédemment, en remplaçant les résultats de chaque individu aux 5 épreuves par les coordonnées de ces individus sur chacun des 5 axes de l’analyse en composantes principales. Cette nouvelle analyse de régression multiple est strictement équivalente sur le plan mathématique : le même R², le même écart-type des résidus, les mêmes contributions des types de pédagogie et des moments de l’automatisation des procédures d’identification des mots, la même contribution cumulée des 5 composantes principales qui se substituent aux 5 variables quantitatives issues des épreuves techniques. Ces 5 composantes principales s’expriment désormais par la position de chaque individu sur 5 axes(19) que nous rappelons ici :

  Vers le pôle négatif Nature de la composante Vers le pôle positif
Axe 1   Effet de niveau réussite globale aux épreuves techniques
Axe 2   Conscience graphique Forte
Axe 3 de l’oral vers l’écrit

Encodage
Opérations de transcodage De l’écrit vers l’oral

Décodage
Axe 4 Phonématique Écriture graphématique
Axe 5 Inférieures au mot Unités linguistiques de travail Au niveau du mot

les composantes sont celles qui organisent les résultats aux épreuves techniques passées en février de CE1. Ce sont, cette fois, des compétences techniques qui s’exercent dans des activités qui portent sur l’écrit mais qui, même au CE1, ne sont pas de la lecture. La question posée À la recherche est justement de savoir si ces compétences techniques généralement construites par des gestes d’enseignement et mesurées par des épreuves morcelées ont un rapport avec la performance en lecture mesurée dans sa diversité et en situation aussi réelle que possible. Le tableau suivant montre comment ces composantes techniques décrites en février de CE1 contribuent À la performance de lecture en CM2.

Quatre facteurs sur les cinq identifiés dans les épreuves techniques contribuent très significativement(20) À l’établissement de la performance de lecture. On sera d’autant meilleur lecteur À la fin du CM2 qu’on est, en février de CE1, efficace techniquement sur les unités linguistiques longues plutôt que sur les éléments simples, sur l’écriture des graphèmes plutôt que sur la notation des phonèmes et qu’on témoigne d’une forte conscience graphique, c'est-À-dire de l’expérience de la spécificité visuelle du fonctionnement de l’écrit, le tout sur un fond de bon niveau général technique. Toutes choses égales par ailleurs, l’élévation au CE1 d’une de ces composantes techniques se répercute positivement sur la performance réelle de lecture au CM2.


Le recours aux composantes principales permet donc de dépasser la difficile interprétation des contributions négatives d’épreuves qui sollicitent le savoir transcoder et la mise en correspondance des unités minimales de chaque code. Car il est peu probable que ces savoirs aient en eux-mêmes un effet négatif. Mais leur maîtrise élevée participe À l’élaboration d’un certain type de processus de lecture et c’est ce processus dont on constate la plus faible efficacité. Le recours aux composantes principales permet de confirmer cette hypothèse, de même que, dans la même analyse, rappelons-le, les contributions très significatives, en positif du choix d’une pédagogie de la voie directe (pas d’enseignement du principe alphabétique), en négatif de la précocité de l’automatisation du processus d’identification des mots.

En résumé, À la question de repérer quelles sont les capacités techniques en milieu de CE1 qu’il est nécessaire de posséder, d’après notre échantillon, pour développer un processus de lecture performant en fin de scolarité élémentaire, on répond avec des probabilités d’erreurs très faibles qu’il est préférable

- au niveau de la taille des unités de travail À prendre en compte, d’assurer la primauté des unités longues sur les courtes

- au niveau de la nature des unités courtes À privilégier, d’assurer la primauté des unités qui constituent la forme visuelle (orthographique) du mot sur celles qui restituent sa forme orale

- et, d’une manière générale(21) au niveau du système linguistique que constitue l’écrit, d’avoir l’expérience (la familiarité) de ce qui est visuellement possible ou non À l’écrit, expérience qui permet sans doute de parler de la spécificité d’une conscience graphique.

À la question de savoir quelles sont les circonstances " scolaires " liées À l’émergence de ces capacités techniques et déjA évoquées en 2.2 et 2.3, il est, avec des probabilités d’erreurs très faibles, préférable

- de bénéficier d’une pédagogie qui ne donne aucun enseignement de la correspondance grapho-phonologique et qui privilégie les investissements techniques visant le développement d’un traitement autonome du système de l’écrit sur des critères internes

- de ne pas développer précocement, en tout état de cause avant la fin du cours préparatoire, un type de réponse technique(22) qui permet d’identifier n’importe quel mot. Cette identification qui apparaît À certains comme une conquête d’autonomie favoriserait le développement de processus qui installent une dépendance entre le traitement de l’écrit et le recours À l’oral et s’opposent À terme À un véritable comportement autonome de lecture.

Ces composantes techniques issues des épreuves techniques passées en février de CE1 et les circonstances pédagogiques du cycle 2 contribuent, on vient de le résumer, À travers une analyse de régression multiple, À la performance de lecture mesurée en fin de CM2. Ces contributions, malgré la démarche statistique qui les construit, n’ont rien d’abstrait ou de théorique. En témoignent ces différences significatives (p = .01) entre les résultats en lecture obtenus au CM2 par les élèves(23) selon qu’ils se trouvent au CE1 À un pôle ou À l’autre de deux axes(24) de l’analyse en composantes principales :



Discussion
Les résultats auxquels nous parvenons sont inhabituels parmi les travaux de la recherche actuelle. Il y a, semble-t-il, plusieurs raisons.


Quelle lecture ?
La première concerne l’imprécision ordinaire de ce qu’on nomme lecture. S’agit-il des opérations À l’œuvre au contact de textes élaborés par un travail d’écriture et qui n’ont, de ce fait, pas d’équivalent À l’oral ? S’agit-il des opérations qui portent sur des phrases ou de discours produits par transcription d’un oral soutenu ? S’agit-il de l’identification de mots isolés, voire de non-mots ? L’habitude a été prise ces dernières années, de laisser dire que la lecture n’est pas l’opération par laquelle un individu comprend un texte écrit, puisque la compréhension n’est pas spécifique À l’écrit mais au langage en général. La lecture serait donc exclusivement l’opération par laquelle s’identifient les mots écrits. On lirait pour comprendre ce qui est écrit mais lire n’est pas comprendre ce qui est écrit. Ainsi, un bon lecteur serait celui qui identifie bien les mots, même s’il ne comprend rien À ce qui est écrit (il est dans ce cas hyperlexique). Il n’est pas encore interdit de discuter une telle position ! Notamment en se demandant si elle ne repose pas sur une réduction de l’écrit À la notation de l’oral, À des usages rudimentaires allant du mot isolé À la phrase, au mieux au texte court. Sans doute y a-t-il peu de différences dans la compréhension de la phrase " le facteur apporte le courrier " selon qu’elle est entendue ou lue, À condition de ne pas se demander dans quelles circonstances elle peut être dite ou écrite. Mais dès qu’il s’agit d’un texte un peu long, d’un texte résultant d’un tissage, d’un entremêlement, d’un travail d’écriture, il n’y a plus d’équivalence possible entre l’écrit et son oralisation. Ce qui est alors écrit peut certes se prononcer mais ne peut avoir été dit. Ce qui est écrit naît de l’écriture. Aussi ne peut-on savoir si ce qui n’est pas compris par un lecteur serait compris si on le lui " lisait ". Car ce qu’il entendrait alors ne serait pas simplement une suite de mots identifiés (À partir desquels il aurait À produire une compréhension) mais déjA nécessairement une interprétation de la fonction du texte, la création d’un sens, ne serait-ce que pour avoir choisi entre est (sera) et est (nord), pour avoir séparé des groupes d’énonciation, pour mettre une intonation qui correspond au moins À la syntaxe de la phrase, bref ce qu’il entendrait est inévitablement le produit de ce qui doit être ajouté À l’écrit pour le comprendre et c’est bien cet ajout qu’en tant que lecteur, il a été incapable de faire. On pourrait donc, plus légitimement et À l’opposé de la définition précédente, dire que la lecture, c’est précisément tout ce qu’il manque À l’identification des mots pour comprendre le texte écrit qu’ils constituent.

À défaut de définition partagée, on peut opter pour une position plus modeste et admettre que les pédagogues, et parmi eux les professeurs de collège lorsqu’ils accueillent les élèves À la fin de la scolarité primaire, savent assez bien évaluer la lecture. Leur professionnalisme en fait de bons juges(25) de ce qu’est, en actes, un comportement réussi. Ainsi, les 4 situations de rencontre de textes complexes dont nous sommes partis pour construire une performance globale font-elles aisément l’accord des spécialistes. Dans l’incapacité de dire ce qu’est la lecture, on peut au moins être assuré que ce qui différencie les individus de notre échantillon À travers le score qu’ils ont obtenu, c’est bien leur qualité de lecteur. Les désaccords entre pédagogues portent sur les moyens de parvenir À cette lecture, pas sur son appréciation.

L’option méthodologique du psychologue qui décide qu’il étudie la lecture lorsqu’il observe l’identification des mots isolés ne peut rendre illégitime (encore moins inutile) l’investigation par le pédagogue de ce processus complexe du lecteur qui " fait quelque chose " d’un message produit, chez l’auteur, par la laborieuse rencontre d’une intention et de ce matériau linguistique bien particulier qu’est l’écrit. Dans cette perspective d’étude de la lecture, l’identification des mots est une opération d’identification parmi de nombreuses autres, au niveau de la phrase, de la structure d’ensemble du texte, du réseau des anaphores ou du croisement des champs lexicaux, etc. Et tout cela simultanément. Ces opérations font appel À des compétences techniques que favorisent sans doute des investissements pédagogiques. Les enseignants seraient en droit d’attendre de la recherche un éclairage sur les relations entre ces compétences techniques et la lecture. Non de la voir réduire À une de ces compétences.


Quel lecteur ?
On retrouve une imprécision de même nature sur le lecteur. S’agit-il de celui qui a appris d’une certaine façon ? Et comment le sait-on ? S’agit-il de celui dont les résultats donnent satisfaction ? Et comment l’a-t-on établi ? Ou d’un étudiant qui passait dans le couloir au moment où l’expérimentateur débutait son protocole ? S’agit-il d’un hyperlexique qui lit très bien mais comprend très mal ? Ou l’inverse ? Pour revenir un instant À notre population, si on compare les 40 % de meilleurs lecteurs aux 40 % les plus faibles À la performance globale que nous avons retenue, on observe de notables écarts dans leur vitesse de lecture et leur compréhension d’un texte littéraire complexe et long (qui constitue une des quatre épreuves contribuant au score composite) :

  Compréhension du texte
(maximum 75 et minimum 31)
Vitesse de lecture en mots/heure

Les 40 % les meilleurs
56.9
18320
Les 40 % les plus faibles
50.8
6830

La différence de compréhension du texte est significative À p = .05 entre les 2 groupes. Quant À la vitesse de lecture, le rapport (p = .000) est presque de 1 À 3. Avec un tel écart, est-il assuré que les bons vont simplement plus vite ? Quel est le poids du pédagogique dans les variations interindividuelles(26) ? Dès lors le chercheur est sommé de définir de qui il étudie le processus de lecture afin de ne pas " naturaliser " l’effet de niveaux d’apprentissage ou de modalités d’enseignement. Un exemple suffira À signaler le risque d’une telle omission : quelques prescripteurs pédagogiques affirment qu’on " sait aujourd’hui que le lecteur fait une fixation visuelle par mot ". Qui est donc ce lecteur ? Nos bons lecteurs À 18000 mots/heure font-ils des fixations trois fois plus brèves que nos lecteurs À 6000 mots ? Trois fois plus nombreuses ? " On " sait qu’il n’en est rien. Une fixation par mot, À raison de 3 couples fixation-déplacement en moyenne À la seconde, c’est une vitesse de lecture autour de 11000 mots À l’heure, À peu près la vitesse de la parole. C’est aussi la vitesse moyenne qu’on retrouve dans des enquêtes sur des populations scolarisées dans le secondaire(27). Invariablement, les bons lecteurs de ces populations ont des vitesses très supérieures et les faibles très inférieures. Même si nous faisons l’hypothèse que la vitesse a, intrinsèquement, peu À voir avec la qualité de la lecture mais qu’elle est, pour l’essentiel, la conséquence d’un processus différent, la précaution méthodologique s’impose de préciser quels lecteurs sont observés pour décrire les processus de lecture.

Nous avons, précédemment, établi À l’échelle de l’échantillon dans son ensemble la contribution positive de 3 capacités techniques sur la performance de lecture mesurée au CM2 : primauté des unités longues sur les courtes, primauté des unités qui constituent la forme visuelle (orthographique) du mot sur celles qui restituent sa forme orale, expérience (conscience graphique) de ce qui est visuellement possible À l’écrit. Pourtant, À considérer seulement les 40 % les plus faibles, aucune de ces capacités techniques n’apporte de contribution significative. Et pour les 40 % les meilleurs, une seule capacité, la conscience graphique, contribue, mais alors de manière très puissante puisque sa variation produit À elle seule, toute chose égale par ailleurs, une élévation de la performance de lecture de 22 points, la faisant passer de 64 À 86. On peut donc faire l’hypothèse qu’il existe une relation entre niveau de performance de lecture et manière dont sont mobilisées les compétences techniques. Ainsi chez les faibles lecteurs, il semblerait qu’on se trouve devant une juxtaposition de compétences sans organisation et sans hiérarchie ; on sait faire des choses mais peu de chose de ces choses. À l’inverse, du côté des bons lecteurs, le processus s’organiserait en fonction de la spécificité du système linguistique sur lequel s’exerce la lecture.

Si nous opposons les mêmes individus, cette fois, non par niveau de lecture mais en fonction de la pédagogie qui leur a été appliquée au cycle 2, on observe que, pour les élèves À qui on a enseigné le principe alphabétique, l’habileté À travailler sur les unités longues (plutôt que sur les éléments du code) contribue, comme pour l’ensemble de la population, significativement (p = .001), À l’établissement de la performance de lecture. Mais on n’observe aucune contribution significative de la conscience graphique (expérience de ce qui est visuellement possible À l’écrit), absence de contribution dont nous avons vu précédemment qu’elle caractérise aussi les 40 % de lecteurs les plus faibles. En revanche, À la différence de ce qui caractérise l’ensemble de notre population, ce sont les unités courtes restituant la forme orale du mot (et non celle qui privilégient sa forme orthographique) qui contribuent positivement (p = .08) À la performance de lecture. Cette information confirme que les démarches pédagogiques centrées sur le principe alphabétique conduisent le lecteur À développer des processus qui privilégient le travail sur les unités du code graphique pertinentes pour établir une correspondance avec les unités du code phonologique. Ce qui est significatif, c’est que cette contribution s’observe seulement pour ce type de pédagogie. Le fait qu’il soit largement majoritaire rend certes plus difficile la perception de la dépendance de ce phénomène À un enseignement particulier. On en vient À prendre pour une caractéristique absolue du processus de lecture ce qui résulte de sa construction par des interventions qui se proposent explicitement de le fonder sur cette correspondance. Et À oublier qu’un enseignement qui fait le choix inverse crée, d’une part, une contribution inverse de cette composante technique et, d’autre part, des résultats sans ambiguïté supérieurs ?

On a une autre confirmation des effets de la pédagogie, en reprenant l’ensemble de notre échantillon et en ajoutant dans la régression multiple initiale les covariances entre les cinq composantes techniques et la pédagogie du cycle 2. On observe que les contributions des unités longues et de la conscience graphique conservent isolément toute leur importance. En revanche, la composante écriture(28) et la pédagogie du cycle 2 ne contribuent plus isolément À la variation de la performance de lecture. Ces 2 contributions disparaissent au profit de leur interaction. Nous retrouvons ce que nous évoquions précédemment mais de manière encore plus synthétique puisqu’ici le modèle rend visible ce qui oppose techniquement les lecteurs selon la manière dont ils ont été enseignés. Force est bien de se demander comment a été enseigné le lecteur qui sert de référence aux actuelles prescriptions pédagogiques...


Quelle recherche ?
Pour des raisons que nous ne développerons pas, la tentation semble pourtant forte de faire l’impasse sur la recherche pédagogique, l’expérimentation et le suivi de cohortes d’apprentis et de fournir des prescriptions simplement déduites des résultats d’une partie singulière des travaux de la recherche dans d’autres disciplines.

Quels bénéfices peut-on escompter de cette confusion des problématiques, des objectifs et des méthodologies ? Pour ce qui concerne la recherche pédagogique, il semble bien qu’elle relève d’un niveau de définition et d’exigence dont n’ont pas encore besoin d’autres disciplines. La lecture apparaît pour elle comme l’opération par laquelle un individu, avec tout ce qu’il sait, se forge un jugement sur un texte. Lire, c’est découvrir la question À laquelle l’auteur s’est confronté par l’écriture. Cette définition oblige À situer la lecture À la rencontre de ce qui est produit par l’écriture, par un usage linguistique particulier, par l’exercice de la raison graphique. De la maternelle À l’université, de plus en plus de pédagogues, aidés À leur tour par les chercheurs sur l’écriture, le texte et la littérature, aident les lecteurs, débutants ou experts, À entrer dans cet univers linguistique nouveau par la rencontre de ce qu’il s’y produit. Ils ressentent l’étrangeté À quoi se résument les tentatives actuelles d’appeler lecture ce que les psychologues étudient. Ils aspirent À d’autres complémentarités entre territoires de recherche que cette désignation. Pour le plus grand profit des uns et des autres.

Ils en trouvent un exemple dans ce versant symétrique, et par lA simultané, de la lecture que constitue l’écriture. Les recherches, aussi bien du côté de la psychologie (cf. M.Fayol) que de la génétique du texte (cf. À.Grésillon) ou des études littéraires, investissent enfin les mêmes champs que la pratique et la recherche pédagogiques. Écrire, pour tous, c’est produire un texte et personne n’y prétend que ce qu’il y a, en dernière analyse, de spécifique À l’écriture, ce serait de tracer des mots isolés, voire des non-mots, sous prétexte que le texte n’est qu’un cas particulier de production de messages linguistiques. Renonçant À l’idée d’une production langagière générale qui n’aurait plus qu’À se traduire dans des langages spécifiques, on fait plutôt l’hypothèse que c’est de la spécificité simultanée des pratiques langagières(29) que s’élabore cette entité abstraite qu’est la langue qui ne sera jamais l’instrument d’aucune production, même pour celui qui cherche À parler comme un livre. En d’autres termes, parler et écrire, ce n’est probablement pas penser d’abord puis actualiser cette pensée À l’oral ou À l’écrit, si bien qu’il n’y aurait finalement de spécifique À la parole que l’émission de mots et À l’écriture que leur transcription. La cohérence de l’objet À construire dans l’échange oral est d’une tout autre nature que dans l’écriture. On se trouve confronté À cette réalité dès qu’on étudie, chez le jeune enfant comme chez l’expert, la production de texte écrit, cette entreprise de rature permanente, ce " passage par l’erreur, l’échec, l’annulation, le zéro, avant d’accepter de confier au silence, À l’ellipse, au non-dit l’essentiel, non pas du sens, mais plus important, de l’effet de sens. Il faut écrire ce qui sera éliminé pour écrire ce qui ne le sera pas. Imprévisiblement, mais inévitablement, la création de l’encore inconnu passe par le négatif, le désordre, le leurre(30). "

Les recherches sur l’écriture travaillent cette hypothèse difficile que l’écriture n’est pas une opération distincte de la pensée À l’écrit, ni préalable, ni conséquence, mais processus même de production. Il est sans doute plus difficile mais tout aussi fructueux de s’imposer pour hypothèse que la lecture n’est pas une opération distincte de la pensée sur l’écrit, ni préalable, ni conséquence, mais processus même de compréhension. C’est cette hypothèse qui respecte le mieux ce qu’on voit le jeune enfant de maternelle tenter de faire avec les textes qu’on lui propose, À l’égal du collégien ou de l’expert. Nous avons essayé de suggérer que la recherche pédagogique pouvait mettre en œuvre une méthodologie qui respecte l’intégrité et la complexité de l’acte de lire en même temps que la nécessité d’explorer la simultanéité des gestes techniques qui le constituent. Au lieu de faire fonctionner des modèles a priori qui ont d’abord pour fonction de rendre possible des manipulations de laboratoire par élimination de facteurs difficiles À contrôler, il est possible À la recherche pédagogique de faire se rencontrer une évaluation de la lecture et autant de compétences techniques qu’on en saura imaginer(31) afin de déterminer lesquelles, en présence de toutes les autres, contribuent À cette performance mesurée dans toute sa complexité. En quelque sorte, c’est l’outil statistique qui constitue et remplace pour le pédagogue le protocole expérimental créé par le psychologue dans la situation de laboratoire. Nul besoin dans ce cas de réduire ce qu’on veut étudier À ce qu’on peut étudier et inutile de besogner la logique pour faire croire qu’on étudiera d’autant mieux la lecture qu’on aura décidé qu’elle est tout entière, pour ne pas choisir le pire, dans l’identification de non-mots hors contexte. L’urgence est dans la complexité d’un rapport À l’écrit qu’il s’agit précisément d’analyser et non de réduire À une tautologie(32).

Finalement ce qui devrait caractériser l’apport de la recherche pédagogique en matière de lecture, c’est la contrainte qu’elle se donne de vivre la nécessité de la classe en prenant en compte simultanément l’investissement qu’opère l’enseignant sur des aspects techniques et l’apprentissage que fait l’enfant d’une manière d’être lecteur ; d’un côté la juxtaposition d’une multitude hypothétique de gestes techniques, de l’autre une manière réelle d’intégrer le recours À l’écrit pour ce qu’il a de spécifique, dans un fonctionnement intellectuel et une relation au monde. La chance méthodologique de la recherche pédagogique réside dans cette double nécessité de suivre cette simultanéité sur les mêmes populations et donc de jouer sur les variables explicatives grâce aux variations pédagogiques. Cette spécificité contribue en retour À l’enrichissement des indispensables approches de la lecture par d’autres disciplines et d’autres méthodologies pour le plus grand profit du débat scientifique.


Quels apports ?
L’étude dont nous venons de rendre compte autorise À faire surgir plusieurs questions un peu vite réglées aujourd’hui :

- Il est possible d’apprendre À lire, À bien lire, et sans doute À mieux lire, en ne recevant pas un enseignement du principe alphabétique et de la correspondance grapho-phonologique. Sur ce point, notre étude ne fait que confirmer l’expérience de nombreuse classes depuis de nombreuses années et apporte un démenti supplémentaire À une opinion qui ne s’appuie d’ailleurs sur aucun protocole scientifique pour affirmer le contraire. Le choix pédagogique de découvrir un nouveau code linguistique À partir des messages qu’il permet de produire réintroduit l’enseignement de la lecture et de l’écriture dans la problématique générale des apprentissages linguistiques, qu’ils soient de l’oral ou de l’écrit, de la langue maternelle ou d’une langue seconde. Ces pratiques rencontrent l’écrit comme système construit et fonctionnant pour élaborer et communiquer de la pensée avant que de réaliser de la transcription phonétique ; elles participent du dynamique essor théorico-pratique qui caractérise aujourd’hui la didactique des langues. Car il ne suffirait pas d’amputer l’enseignement habituel de la lecture du travail sur la correspondance grapho-phonologique pour créer les conditions d’un apprentissage linguistique. Cette construction pratique est l’objet prioritaire de la recherche pédagogique sans lequel elle se réduit À la justification sempiternelle de ce qui est, malgré l’évidence de la médiocrité des résultats qu’on cherche alors À imputer aux différents acteurs, enseignants et apprenants.

La question reste en effet mal posée tant qu’on la réduit À prendre ou non appui sur le principe alphabétique, toutes choses restant par ailleurs inchangées comme si le choix était seulement de nature technique. Selon qu’on privilégie dans l’écriture cette fonction particulière introduite par l’alphabet grec de rendre possible l’identification graphique des phonèmes ou qu’on donne priorité À la commune caractéristique de tous les systèmes d’écriture, y compris alphabétique, d’exercer une pensée visuelle et une raison graphique, on abordera son enseignement comme une technique de notation ou comme l’apprentissage inséparable d’un mode de pensée et d’un code linguistique spécifiques. Cette question du code, dans tous les cas déterminante, est, en outre, l’objet d’un redoutable malentendu. Car, dans la continuation de l’hypothèse historique d’alphabétisation, ce qu’on appelle code est alors principe et système de correspondance entre deux codes linguistiques dont l’un est encore ignoré de l’apprenti ; on fait le pari que le code graphique se construira comme produit de la transformation du code phonologique par un principe et une table de correspondance. À l’inverse, dans un apprentissage linguistique, le code cible se rencontre et se découvre dans ses rapports au message (et non À un autre code), en tant que construction des unités pertinentes et de leur combinatoire (au sens mathématique). Dans la perspective alphabétique, au contraire, l’apprenti ne découvre ce code graphique que dans la mesure où il s’y heurte, quand ce qui est rencontré diffère de ce qui est attendu, non comme matériau sur lequel se développe le processus de lecture mais comme échec du processus de transcription. Une sorte d’objet en négatif(33).

Pour autant, cette correspondance oral-écrit fait aussi partie de la langue (une modalité de l’interlangue ?). Sans en faire le pivot de la lecture, pourquoi ne pas l’introduire quand elle vient épauler les processus sémantiques À l’œuvre spécifiquement sur l’écrit ? Personne ne soutiendra qu’un lecteur expert se reconnaît À ce qu’il serait incapable de prononcer une forme écrite qui n’existe pas (ou qu’il n’a jamais vue, ce qui revient au même). Rappelons que les élèves À qui on n’enseigne pas le système de correspondance grapho-phonologique le construisent néanmoins avec un différé plus ou moins long(34). Nos résultats suggèrent qu’il ne s’agit pas nécessairement du même processus de correspondance selon qu’il est abordé initialement comme outil d’investigation dans un système inconnu À partir d’un système connu ou lorsqu’il s’élabore À partir de l’expérience concrète d’une correspondance entre deux codes linguistiques dont la construction pour le deuxième se fait, comme pour le premier, sans référence extérieure. Certes, le fonctionnement alphabétique donne rapidement quelques résultats et l’impression de savoir tout lire (À condition toutefois de réduire la lecture À la prononciation des formes écrites, leur identification étant déjA une autre affaire). Pour autant, nos résultats montrent que cet avantage s’inverse, ce que confirme d’une autre manière la contribution négative de l’automatisation précoce du processus d’identification des mots. L’incontestable autonomie initiale parasiterait l’apprentissage de la lecture en donnant quelques primes À une voie illusoire(35), en enfermant dans un processus de traitement dont l’inadaptation se révèle dès la rencontre de textes dont la lecture est recherche d’écriture.

Au fond, la question que les pédagogues posent À la psychologie anticipe manifestement sur ses capacités d’investigation : pourquoi apprend-on mal À lire quand on apprend À déchiffrer ? Difficile de répondre tant qu’on prend le déchiffrement pour de la lecture, tant qu’on ne met pas en présence deux objets distincts : d’un côté une performance de lecture qui se mesure dans un rapport " remarquable " aux textes construits par un travail d’écriture, de l’autre des gestes techniques dont on est loin d’avoir achevé l’inventaire mais qui sont eux-mêmes À construire À partir de situations sollicitant des opérations sur l’écrit ou sur l’oral. Nos résultats nous autorisent À dresser un portrait technique peu ambigu de l’élève de CE1 qui deviendra un bon lecteur À l’entrée en 6ème. Il possède cette capacité À travailler sur des unités longues, ici le mot(36). Il témoigne aussi d’une compétence au niveau de ces unités distinctives que sont les graphèmes qui permet d’établir une graphie correcte, de " graphier droit ", d’orthographier plutôt que de transcrire. Le bon lecteur sait que les mots ne se " voient " pas comme ils se prononcent mais comme des formes visuelles répondant À une cohérence générative interne retrouvant l’initiale dimension iconique de l’écrit. Le bon lecteur est enfin celui qui, indépendamment de ces deux compétences précédentes, a développé une conscience graphique. Ne doutons pas que cette question passionnera les psychologues dans une quinzaine d’années : de quelle expérience se nourrit la conscience linguistique du lecteur expert ? Nous avons tenté ici de la saisir À travers la familiarité de ce qui est ou non possible À l’écrit, en quelque sorte une expérience de la combinatoire(37). On peut s’étonner du peu d’étonnement que provoque encore l’invocation compulsive de la conscience phonologique lorsqu’on parle de lecture. Cette inconscience d’une conscience graphique qui serait À l’écrit ce que la conscience phonologique est À l’oral est liée aux présupposés majoritaires des recherches. Il y aurait pourtant moins d’audace pour un scientifique À faire l’hypothèse qu’une conscience linguistique se construit dans la fréquentation d’un système linguistique que de pointer un espace vide du ciel en soutenant qu’il devrait s’y trouver une planète ! Apprendre À lire et À produire des textes, n’est-ce pas développer l’expérience particulière d’un système linguistique particulier dont la rencontre et l’usage engendrent nécessairement une conscience particulière ? Cette conscience doit être au cœur des questions de lecture : comment la déceler(38), sur quelles expériences se constitue-t-elle, quels sont ses points d’appui, comment évolue-t-elle, quels sont ses rapports avec d’autres consciences, quel rôle de l’enseignement dans son développement, quelles activités réflexives, etc.
Pour inhabituels dans la littérature de recherche que soient les faits qui suggèrent ce questionnement, ils sont À discuter À travers une analyse du protocole expérimental qui les a établis et de la méthode statistique qui les a construits. Il s’agit ensuite de les reproduire sur de nouvelles populations et aussi de retraiter des résultats de recherches existantes. À moins qu’il soit plus rassurant de les nier…

 


Notes

(1) Travail coordonné jusqu’au CE2 par Roland Goigoux qui en a fait le matériau de sa thèse

(2) Tous les enfants (de même âge À 3 mois près) terminaient en juin 1990 leur Grande Section. À l’âge normal qui va correspondre pour la grande majorité d’entre eux au CM2, tous ceux qui ont été retrouvés ont été pris dans l’évaluation, qu’ils aient redoublé ou se trouvent déjA en 6ème. Il s’agit donc de leurs résultats À l’âge où ils devraient être en CM2.

(3) Le rapport de recherche paraît en 1998. Nous renvoyons le lecteur À ces documents pour tout ce qui concerne la description des instruments d’évaluation utilisés ou la méthodologie des traitements statistiques, ainsi que la représentativité des 59 élèves de 1995 par rapport aux 76 initiaux.

(4) et d’autant plus facilement vérifiables que les données jusqu’au CE2 sont communes À la thèse de R.Goigoux et À la recherche INRP. Nous les tenons, ainsi que les plus récentes À disposition.

(5) Nous avons choisi de présenter ici les résultats À partir d’un score composite (avec des distributions de moyenne = 50 et d’écart-type = 20) afin de ne pas multiplier les traitements par le nombre d’épreuves initiales. Mais il est évident que nous nous sommes assurés que le score composite réagit comme les épreuves séparées. Au CM2, ce score a été construit À partir de 4 épreuves : lecture documentaire, prises d’informations dans des articles de journaux, analyse d’un texte littéraire, localisation d’extraits dans des ouvrages documentaires et de fiction. Au CE1 et au CM2, l’inégale représentation des catégories sociales et des niveaux d’études des parents a été neutralisée par l’utilisation d’une pondération.

(6) La différence des moyennes n’est significative qu’au CM2 entre voie directe et voie indirecte (p = .02). Les autres différences ne sont pas significatives. Si on oppose les pratiques pédagogiques sur le critère d’exclure ou d’inclure l’enseignement du principe et de la correspondance grapho-phonologique (donc voie directe d’un côté, et de l’autre voie indirecte et ce que nous avons appelé mixte), la différence des moyennes n’est toujours pas significative en CE1 et significative À p=.02 au CM2 en faveur des élèves qui n’ont pas appris À déchiffrer.

(7) Nous ne sommes pas les premiers À observer les effets différés des approches de la lecture ne prenant pas appui sur un enseignement du principe alphabétique. On en trouve par exemple trace dans la recherche de Content & Leybart (1989,1990) que cite L. Sprenger-Charolles dans l’ouvrage collectif dirigé par Michel Fayol : Psychologie cognitive de la lecture (Paris, PUF). En observant le tableau de résultats des élèves ayant reçu un enseignement ‘phonique’ ou un enseignement ‘global’, on voit bien qu’en 2ème année, les élèves ‘phoniques’ vont nettement plus vite et donnent un % de réponses correctes plus élevé dans la lecture de mots isolés, fréquents/rares, réguliers/irréguliers que les élèves ayant reçu un enseignement ‘global’. Mais ces différences s’annulent en 4ème année et s’inversent totalement en 6ème année. À ce moment, on découvre que si le % de réponses correctes est le même en ce qui concerne les mots réguliers (fréquents ou rares), il est très nettement supérieur pour les classes globales pour les mots irréguliers (fréquents ou rares). Et le temps de réponse (qui semble un bon indicateur du degré de maîtrise d’une opération) est systématiquement plus court dans les classes globales, quel que soit le type de mots, et ceci en moyenne de plus de 25 %.

(8) Pourquoi celles-lA, et À cette date ? C’est en février de CE1 qu’il a été procédé À la dernière passation d’épreuves comme bilan de l’apprentissage initial dans le domaine de compétences techniques. Nous faisons bien la différence entre, par exemple, l’identification de mots dont nous supposons qu’elle contribue À la lecture et la lecture elle-même qui est un processus complexe et global pour comprendre des textes écrits. Il nous semble que l’objet de la recherche consiste À trouver en quoi et comment des " gestes " techniques (comme l’identification de mots isolés ou la prononciation de pseudo-mots) contribuent À la réussite de l’acte de lecture et non À affirmer, sans en construire la preuve, qu’ils " sont " la lecture.

(9) La régression multiple permet de " recalculer " la variable endogène À partir d’une constante et de coefficients appliqués À chaque variable exogène. C’est cette constante qui est représentée dans les graphiques. Les différences entre les valeurs observées et les valeurs recalculées donnent une indication de l’efficacité du modèle À travers sa capacité À réduire la variation interindividuelle (décrite par l’écart-type).

(10) Le R² (coefficient de régression multiple) exprime la capacité du modèle À rendre compte de la variation du résultat À expliquer. Il est ici de .46

(11) F= 4.99 pour un ddl 2/49 signif. À p = .01

(12) Le moment de l’accès À l’autonomie des procédures d’identification des mots semble un critère qui différencie très nettement les types de pédagogie comme en témoigne ce tableau croisé répartissant les élèves

  Automatisation précoce : 90 % de réussite dès le mois de juin de CP Automatisation moyenne : plus de 70 % À la mi-CE1 Automatisation tardive : moins de 70 % (et parfois même moins de 40 %) À la mi-CE1
Sans enseignement de la correspondance grapho-phonologique (voie directe)
26.6 %
36.8 %
36.6 %
avec correspondance grapho-phonologique comme recours (mixte)
51 %
49 %

-
Avec correspondance grapho-phonologique comme base des processus de lecture (voie indirecte)
63.6 %
36.4 %
-

(13) La contribution est forte puisqu’elle joue sur un intervalle d’une quinzaine de points de part et d’autre de la constante, même si, À l’arrivée (sans doute parce que l’effet négatif de cette précocité est partiellement compensé par l’efficacité qu’elle permet d’acquérir, notamment À l’épreuve lexicale) la pénalité réelle sur la performance de lecture au CM2 est seulement d’un peu plus de 9 points.

(14)À ski, un apprentissage initial du virage " en chasse-neige ", efficace pour, en quelques jours, passer n’importe où, semble contaminer durablement l’exercice du virage expert par flexion-extension avec skis parallèles. Deux gestes qui ne sont assurément pas dans le prolongement l’un de l’autre et mettent en œuvre des modes antagonistes de réalisation de l’équilibre dynamique. C’est donc une chose de dire que pour exceller dans une langue étrangère, mieux vaut d’abord être nul en thème et en version et une autre de dire qu’il est préférable de ne pas recevoir un enseignement qui vise initialement À réussir thème et version.

(15) F= 3.67 pour un ddl 2/49 signif. À p = .03

(16) Dans la mesure où, À l’issue du CE1, les élèves, dans leur majorité, sont restés dans leur école, il faut néanmoins s’assurer que les différences observées ne trouvent pas leur origine dans ce qui se passe au cycle 3. Il existe au moins deux manières statistiques de procéder À cette vérification :

- introduire dans le modèle la performance de lecture À l’issue du CE1 parmi les variables explicatives. On constate que la performance CE1 apporte une contribution significative (p = .007)et que dans le même temps l’effet du type de pédagogie disparaît (F= 1.09 pour un ddl 2/48 NS). Ce double mouvement autorise À penser que l’effet de la pédagogie au cycle 2 est déjA inscrit dans la performance À la fin du CE1.

- prendre la performance de lecture À la fin du CE1 comme variable À expliquer par les 7 variables explicatives du modèle initial. On constate que le modèle est très robuste (R²=.84). Deux variables seulement ont une contribution significative : le résultat À l’épreuve lexicale (p = .000) et le type de pédagogie (F=8.54 pour un ddl 2/49 signif. p = .0006) avec le même sens de contribution, positif pour la voie directe, négatif pour la voie indirecte.

(17) On ne tiendra pas compte ici de la valeur propre de chacun de ces nouveaux axes puisqu’il est nécessaire de les conserver tous afin de retrouver À l’identique la totalité de la variance initiale des résultats.

(18) Cette question d’unités linguistiques inférieures ou au moins égales au mot pourrait sans doute être décrite aussi en terme d’accès À un signifiant, donc dans une perspective sémantique.

(19) Nous avons retourné les 3 premiers axes (multipliés par -1) de l’analyse en composantes principales dans un souci de lisibilité des résultats de la régression multiple afin de ne pas avoir À parler de la contribution négative d’un résultat positif

(20) Les t pour un ddl de 49 vont de 3.796 À 2.023 (p = .000 À p = .049)

(21) Rappelons que par construction de l’analyse factorielle, les axes (les composantes principales) sont strictement indépendants, c'est-À-dire qu’il n’y a aucune corrélation entre eux. Les 3 contributions que nous citons ne sont pas 3 manières de dire la même chose mais 3 compétences techniques distinctes qui contribuent chacune positivement et indépendamment À la performance de lecture, même s’il est visible que ces 3 compétences dessinent une manière cohérente d’être lecteur qui s’oppose À une autre manière dont l’efficacité est significativement inférieure. Si on compare les individus qui sont simultanément aux pôles négatifs de ces 3 facteurs À ceux qui sont aux pôles positifs, on observe une variation du simple au double (34 points contre 66) de la performance de lecture au CM2.

(22) LA encore, ces 2 conditions ne sont pas 2 manières différentes de dire la même chose. L’effet de la précocité s’observe différemment selon que les pratiques pédagogiques choisissent ou non d’enseigner le principe alphabétique mais, même dans le cas où il est enseigné, l’avantage de la précocité est faible et absolument pas significatif.

(23) Il s’agit de 80 % de notre échantillon (40 % À chaque extrémité de l’axe).

(24) Pour les autres axes, les différences existent également mais elles ne sont pas significatives. Il est impossible de recréer dans un tableau de résultats ce qui correspond À la formule " toutes choses égales par ailleurs " de la régression multiple.

(25) Au sens que ce mot revêt dans les protocoles scientifiques.

(26) Nous ne développerons pas cet aspect pour ne pas alourdir la conclusion mais les différences existent selon les types d’investissement technique.
Par exemple :

  Compréhension du texte (maximum 75 et minimum 31) Vitesse de lecture en mots/heure
Sans enseignement du principe alphabétique
54.6
14000
Avec enseignement du principe alphabétique
50.5
9750

la différence des compréhensions n’est pas significative, celle de la vitesse l’est.

(27) C’est, approximativement, la vitesse moyenne de notre échantillon mais, on s’en doute, avec un écart-type considérable important.

(28) construite sur une épreuve d’écriture inventée (inspirée de Ferreiro) et opposant la réponse observée phonème par phonème À celle graphème par graphème

(29) On rejoint par une autre voie la question des bilinguismes.

(30) Bernard cerquilini, 1989, in Louis hay, La Naissance du texte, Paris, José corti, p 105-120.

(31) Nous ne reviendrons pas sur l’urgente modestie de ne pas confondre le résultat d’une épreuve conçue pour mesurer une capacité technique avec la mesure de cette capacité, comme si l’outil offrait l’assurance de mesurer ce pour quoi il a été conçu et de ne mesurer que cela. D’où l’intérêt méthodologique d’identifier les compétences techniques À travers des analyses en composantes principales portant sur de nombreuses épreuves destinées déjA À isoler un geste technique. Par exemple, dans notre étude, la compétence technique construite par le 5ème et dernier axe de l’ACP (et qui oppose ce qui est techniquement en jeu dans le travail sur des unités inférieures au mot À ce qui permet de travailler sur le mot) naît dans le rapport de 3 épreuves mais n’a été le principe de construction d’aucune de ces épreuves. Il se trouve que cette composante technique contribue de manière très significative dans l’analyse de régression multiple À la performance de lecture. Pourtant, dans l’ACP qui a permis de la découvrir, sa valeur représente 1.57 % de la somme des valeurs propres…

(32) Le mot est faible lorsqu’on voit le nombre de chercheurs qui concluent À la valeur prédictive de la conscience phonologique À partir de protocoles où le dispositif pédagogique repose sur la médiation phonologique et où la " lecture " est massivement évaluée À travers l’identification de mots...

(33) On se souvient des méthodes de lecture d’autrefois qui mettaient en petits caractères ou d’une autre couleur les lettres qu’on ne prononçait pas et dont la présence troublait l’harmonie du système de correspondance.

(34) dont on ne sait pas encore s’il s’explique par la complexité de ce qui est À construire ou dans la probable imperfection des apports pédagogiques. Une raison d’optimisme tient dans le fait que la pédagogie de la voie directe en est encore À ses débuts et qu’elle ne peut que progresser tandis que les techniques d’alphabétisation ont depuis 150 ans atteint une perfection qui rend illusoires les exhortations perpétuelles À les employer pour remédier À la médiocrité des résultats qu’elles donnent.

(35) Voie suffisante dans une perspective d’alphabétisation de masse où, somme toute, le besoin en lecteurs experts change peu. Voie dont on mesure l’inadéquation depuis 30 ans dès lors qu’est visée une scolarité secondaire pour l’ensemble d’une classe d’âge et que révèlent les évaluations nationales À l’entrée en 6ème (moins de 20 % des élèves font preuve de ces compétences remarquables qui permettent de comprendre ce qu’un texte veut dire au delA de ce qu’il dit explicitement).

(36) Les épreuves que nous avons utilisées en février de CE1 ne proposaient pas un travail sur des unités linguistiques supérieures au mot. Dans une autre étude sur la même population mettant en relation la performance de lecture et, cette fois, les compétences techniques mesurées au CM2, on observe une contribution très significative de la capacité À travailler sur des unités plus longues, au moins du niveau de la phrase. " Le bon lecteur témoigne de l’habileté, presque au sens d’agilité, À créer des hypothèses de sens et À les faire fonctionner sur des éléments graphiques alors que le mauvais lecteur est plutôt du côté de la fusion, de la construction À partir de ces éléments. " (D. Foucambert, 1997)

(37) au sens d’une combinaison d'éléments qui, formant un ensemble, ont des positions relatives variables de nombre limité.

(38) On trouve un exemple, pour rester sur le même, de cette conscience méconnue dans les résultats de Content et Leybart que nous évoquions dans la note n° 7. Pourquoi les élèves À qui n’a pas été enseigné le principe alphabétique commettent-ils moins d’erreurs sur les mots dits irréguliers ? Quel savoir ont-ils développé qui leur permet d’identifier tous les mots, réguliers ou non, beaucoup plus vite que les élèves qui ont construit leur rapport À l’écrit sur la médiation phonologique ? Peut-on faire durablement l’économie de ces réponses ?